扫描下载APP
其它方式登录
DeepSeek发布多模态模型‘Thinking with Visual Primitives’,提出以坐标和边界框为思维单元的新推理范式,解决多模态大模型‘看得清但想不清’的指代鸿沟问题;通过视觉原语嵌入思维链、7056倍视觉压缩及精细化冷启动数据训练,在计数、空间与拓扑推理任务上显著超越GPT-5.4等前沿模型。
2026年4月,AI生图领域形成OpenAI GPT-Image-2、Google Gemini 3.1 Flash Image和字节跳动Seedream 5.0 Lite三强格局。文章从语义理解、画质风格、文化语境、生成体验及合规水印四大维度实测对比,指出三者分别优势在于逻辑精准性、速度与真实感、东方审美与本土化表达,强调AI生图正推动设计从能力转向工具,核心价值回归人类创意决策。
阶跃星辰发布Step 3.5 Flash系列大模型,聚焦毫秒级推理速度、多模态处理及低成本API调用,面向移动端与高频交互场景优化,推动国产大模型从参数竞赛转向效率与商业化落地。
京东加速AI全栈布局,开源JoyAI-LLM Flash大模型,推出‘龙虾’智能体并实现调用量激增455%;数字人技术覆盖7万商家、带动百亿GMV;具身智能项目JoyInside联合近百品牌,计划两年内建成全球最大的真实场景视频数据库,构建覆盖云、端、物理世界的AI闭环。
iPhone17Pro在仅12GB内存下成功本地运行4000亿参数大模型,依赖Flash-MoE流式加载与MoE稀疏激活技术,但生成速度仅0.6Token/秒、功耗高、发热大;此举验证了终端设备本地大模型的可行性,凸显隐私保护与离线AI潜力。
美团龙猫团队开源数学形式化与定理证明模型LongCat-Flash-Prover,通过自动形式化、草稿生成和证明生成三大能力,实现从概率预测到严谨逻辑证明的范式转变,在MiniF2F等基准测试中刷新SOTA,依托TIR框架与Lean4Server校验提升逻辑可靠性,推动AI成为基础科学研究的底座设施。